Conditions générales pour l'admissibilité de la programmation dynamique dans la décision séquentielle possibiliste

نویسنده

  • Paul Weng
چکیده

RÉSUMÉ. Nous nous intéressons à la contrepartie possibiliste des processus de décision markoviens. À l’instar du modèle classique, trois relations de préférence peuvent être distinguées (préférences sur les chemins, sur les loteries et sur les politiques). Nous énonçons des propriétés simples et suffisantes (transitivité, invariance par translation, indépendance) sur la relation de préférence sur les loteries pour permettre l’utilisation de méthodes fondées sur la programmation dynamique. Nous fournissons enfin un exemple d’application de ces résultats avec l’utilité bipolaire possibiliste.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Programmation dynamique à base de points pour la résolution des DEC-POMDPs

RÉSUMÉ. Nous présentons un nouvel algorithme de planification pour la construction de systèmes multi-agents réactifs et situés pouvant se modéliser par des processus de décision de Markov décentralisés (DEC-POMDP). Cet algorithme est fondé sur la programmation dynamique à base de points. Il est dérivé de techniques de programmation dynamique optimale utilisées pour résoudre des jeux stochastiqu...

متن کامل

Processus de décision markoviens et préférences non classiques

RÉSUMÉ. Le modèle classique des processus de décision markoviens repose implicitement sur une structure de préférence induite par l’existence de coûts scalaires additifs et l’utilisation d’un certain critère d’évaluation des politiques (total, total pondéré, moyenne, ...). Cette structure de préférence s’appuie sur des hypothèses fortes permettant de vérifier les principes de la programmation d...

متن کامل

La Programmation Dynamique Séquentielle Et Parallèle : Etat De L’art Critique Et Classification

RÉSUMÉ : Dans cet article, nous nous intéressons au paradigme de la programmation dynamique (PD) séquentielle et parallèle et ce, pour la résolution de problèmes d’optimisation combinatoire (POC). L’état de l’art critique et systématique que nous développons commence par la présentation des trois principales classifications de POC résolubles par la PD connues dans la littérature. Une comparaiso...

متن کامل

Modélisation intégrée de la dynamique des systèmes d'information décisionnels

Résumé. Les systèmes d’information décisionnels (SID) sont des systèmes d’information (SI) qui ont pour objectif de faciliter la prise de décision à partir d’information résultant de processus complexes de dérivation et de préparation des données de SI sources. Ces processus sont généralement peu modélisés et sont directement implantés avec des logiciels spécifiques au cours des projets décisio...

متن کامل

Un Caml Light Distribué

Résumé. Dans cet article nous proposons une extension du langage fonctionnel Caml Light appelé ACCL (pour A Concurrent Caml Light) dont le but est de combiner les paradigmes de programmation impérative, fonctionnelle, de concurrence et de distribution dans un seul langage de programmation. Pour l’extension concurrente de Caml Light nous proposons quelques primitives avec une sémantique très sim...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:
  • Revue d'Intelligence Artificielle

دوره 21  شماره 

صفحات  -

تاریخ انتشار 2007